Sur l'utilisation de LDA en RI pair-à-pair
نویسندگان
چکیده
We revisit the problem of defining a peer-to-peer system for Information Retrieval when each peer’s topic-based profile is obtained using Latent Dirichlet Allocation. This method, defined for a centralized collection, provides a rich representation of the topics and of the documents. We describe two ways of using it in a distributed system and analyze their advantages and drawbacks. Then, we illustrate the use of the obtained topic-based profiles within two systems. The first one is unstructured and uses a gossip-based algorithm to obtain dynamic overlays of topically related peers. This requires defining a similarity between profiles. The second one uses super-peers and maintains a topic-based index of the peers, which is recorded in a distributed Hash table. The keys are derived from the topic-based profiles. MOTS-CLÉS : Recherche d’information, systèmes pair-à-pair, Allocation Latente de Dirichlet (LDA).
منابع مشابه
Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair
Résumé. Les systèmes pair-à-pair (peer-to-peer, P2P, égal-à-égal) se sont popularisés ces dernières années avec les systèmes de partage de fichiers sur Internet. De nombreuses recherches concernant l’optimisation de la localisation des données ont émergé et constituent un axe de recherche très actif. La prise en compte de la sémantique du contenu des pairs dans le routage des requêtes permet d’...
متن کاملFouille de données dans les systèmes Pair-à-Pair pour améliorer la recherche de ressources
Résumé. La quantité de sources d’information disponible sur Internet fait des systèmes d’échanges pair-à-pair (P2P) un genre nouveau d’architecture qui offre à une large communauté des applications pour partager des fichiers, des calculs, dialoguer ou communiquer en temps réel. Dans cet article, nous proposons une nouvelle approche pour améliorer la localisation d’une ressource sur un réseau P2...
متن کاملDosimetry at high-energy accelerators
R É S U M É Les problèmes de la dosimetric dans les champs de rayonnements ionisants diffusés autour des accélérateurs de haute énergie sont présentés. Après une courte introduction sur l'historique des grandeurs physiques utilisées pour l'acquisition de l'équivalent de dose, les techniques diverses pour la dosimétrie dans des champs mixtes à haute énergie sont décrites, en commençant par des m...
متن کاملEléments de caractérisation des environnements des systèmes pair à pair
RÉSUMÉ. Pour évaluer les systèmes pair à pair, il est nécessaire de comprendre les influences qui s’exercent sur eux. Dans cet article nous avons étudié certaines de ces influences d’un point de vue client contrairement au point de vue serveur usuel. Une caractérisation d’un certain nombre de ces facteurs influents tels que l’activité des utilisateurs ou la présence de différents types de fichi...
متن کاملFouille au code OCaml par analyse de dépendances
La section 3 présente la construction de ce graphe, enrichie au fur et à mesure des tests et des ré exions. En section 4, nous expliquons comment exploiter ce graphe pour e ectuer les analyses qui nous intéressent, notamment en dé nissant un langage de sélection de sommets (éléments) sur le graphe. En n, la section 5 donne des informations sur l'implémentation de cette analyse dans un outil en ...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2013